[8.x] Optimize memory usage in ShardBulkInferenceActionFilter (#124313) #124863

jimczi · 2025-03-14T09:52:15Z

Backports the following commits to 8.x:

Optimize memory usage in ShardBulkInferenceActionFilter (Optimize memory usage in ShardBulkInferenceActionFilter #124313)

This refactor improves memory efficiency by processing inference requests in batches, capped by a max input length. Changes include: - A new dynamic operator setting to control the maximum batch size in bytes. - Dropping input data from inference responses when the legacy semantic text format isn’t used, saving memory. - Clearing inference results dynamically after each bulk item to free up memory sooner. This is a step toward enabling circuit breakers to better handle memory usage when dealing with large inputs.

elasticsearchmachine mentioned this pull request Mar 14, 2025

Optimize memory usage in ShardBulkInferenceActionFilter #124313

Merged

elasticsearchmachine added the v8.19.0 label Mar 14, 2025

elasticsearchmachine merged commit 17e2721 into elastic:8.x Mar 14, 2025
15 checks passed

jimczi deleted the backport/8.x/pr-124313 branch March 14, 2025 11:03

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[8.x] Optimize memory usage in ShardBulkInferenceActionFilter (#124313) #124863

[8.x] Optimize memory usage in ShardBulkInferenceActionFilter (#124313) #124863

Uh oh!

jimczi commented Mar 14, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

[8.x] Optimize memory usage in ShardBulkInferenceActionFilter (#124313) #124863

[8.x] Optimize memory usage in ShardBulkInferenceActionFilter (#124313) #124863

Uh oh!

Conversation

jimczi commented Mar 14, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants